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(57) L'invention concerne un procede d'affectation 
de taches dans un systeme de traitement de donnees 
numeriques rnultip roc esse ur a systeme Sexploitation 
preemptif et une architecture pour la mise en oeuvre de 
ce procede. Le systeme comprenant des processeurs 
(200-203 et 210-21 3) susceptibles de trailer les taches 
en parallele repartis en groupes (200-201, 202-203) 
Une file d'attente elemental (5 a , 5 6 ) est associee a* 
chacun des groupes de processeurs (200-201 
202-203) et enregistre des taches a executer. Toutes les 
taches a executer (7, a 7 10 ) sont enregtstrees dans une 
table (4). Chacune des taches (T, a 7 10 ) de la table (4) 
est associee a I'une des files d'attente (5 a , 5 b ) et chacu- 
ne des taches enregistrees dans les files d'attente (5 a , 
5 b ) est associee a I'un des processeurs (200 a 201 ) Les 
associations sont effectuees par des jeux de pointeurs 
croises (p 2?0 a p 203 , PP 5 a , pps^ p t„ pT s , p r 10 , p 5a1 a 
P5a4» Psbi a P56io)- Dans un mode de realisation sup- 
plemental, selon plusieurs variantes, on procede a un 
(re-)equlibrage de la charge du systeme entre files d'at- 
tente elementaires. 
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cesseurs & I'une des files d'attente elementaires. 

[0015] Cette disposition permet notamment de limiter ie nombre de processeurs accedant aux verrous et done de 
limiter ie phenomene de contention. 

[001 6] Cependant. I'experience montre que, lorsque Ie nombre de taches et Ie nombre de processeurs augmentent 
la disposition precitee ne permet plus d'ameliorer les pertormances du systeme. 
[001 7] Ceci est du a plusieurs phenomenes et notamment aux suivants : 

[0018] Dans un systeme d'exploitation moderne existent deux types de taches : les taches a priorite variable et les 
Inches a priorite fixe. Les taches du premier type sont des t§ches dont la priorite varie en fonction du temps de pro- 
cesses consomme (la politique d'ordonnancement est definie par Ie systeme d'exploitation lui-rneme). Les taches du 
second type sont des taches dont la politique d'ordonnancement est fixee lors de la definition de la tache par Ie pro- 
grammeur. 

[0019] En premier lieu, la gestion des taches de priorite fixe dans un systeme comportant plusieurs files d'attente 
selon une premiere caracteristique du premier mode de I'invention, peut devenir complexe, car il est necessaire d'eviter 
qu'une premiere tache de priorite plus elevee soit executee apres une seconde tache de priorite moins elevee Cette 
gestion s'avere en effet difficile, et surtout couteuse en temps, lorsque les deux taches precitees sont dans deux files 
d'attente distinctes. On concoit aisement que cette difticulte augmente rapidement avec Ie nombre de taches qui se 
repartissent dans un grand nombre de files d'attente. 

[0020] Le probleme subsiste pour des taches de priorite variable, mais la difficulte de mise en oeuvre est moindre 
car e'est le systeme d'exploitation lui-meme qui fixe les priorites, et il peut se permettre de violer ses propres regies 
[0021] En second lieu, le traitemenl des taches peut devenir desequilibre. Les laches etant, a priori, de natures 
heterogenes. le temps necessaire au traitement de celles-ci peut varier dans de fortes proportions d'une tache a ('autre 
II s'ensuit que un ou plusieurs processeurs, ou groupes de processeurs, peuvent se trouver en sous-charge, voire 
devenir inactifs, faute de taches a trailer (les files d'attente associees s'etant videes), alors qu'un ou plusieurs autres 
processeurs, ou groupes de processeurs, continuent de traiter des taches (voire etre surcharges) et qu'il reste des 
taches a oxecuter dans les files d'attente associees a ceux-ci. Aussi, dans un second mode de realisation prefere de 
I'invention, tout en conservant les dispositions propres au premier mode de realisation (partition des files d'attente) 
on procede a un reequilibrage du traitement des t£ches, selon plusieurs variantes. 

[0022] Selon une premiere variante, le reequilibrage comprend une repartition optimisee des taches entre les diffe- 
rentes files d'attente du systeme. Le mode de repartition tient compte de differents parametres qui seront precises 
dans ce qui suit. La repartition peut etre effectuee, soit lors de la creation de la tache, soit lors de I'association realisee 
entre la tache et un fichier contenant le programme k executer. 

[0023] A litre d'exemple, dans un environnement de type "UNIX" precite\ cette association est realisee par une ins- 
truction de type : m exec()\ Cette seconde option est preferable lorsque le systeme multiprocesseur est du type "NUMA 1 
precite. 

[0024] Cette disposition ameliore les performances du systeme, y compris lorsque le nombre de taches a traiter est 
tres eleve. Cependant, la courbe representant les performances presente des oscillations, qui traduisent des instabi- 
lity, notamment lorsque le nombre de taches devient eleve. En outre, il est encore possible d'ameliorer les perfor- 
mances. 

[0025] Selon une deuxieme variante de realisation du second mode, lorsque la file d'attente associee a un proces- 
ses, ou k un groupe de processeurs, devient vide et que le processeur ou au moins I'un des processeurs n'a plus de 
tache en cours de traitement, le processeur recherche dans les autres files d'attente s'il existe des taches en attente 
de traitement. Si cette recherche est positive, dans un mode prefere, le processeur recherche ce qu'on pourra appeler 
la "meilleure tache a traiter", s'il existe plusieurs taches en attente. Le mode de recherche et de selection de cette 
t£che sera precise dans ce qui suit. 

[0026] On doit bien comprendre que dans ces deux variantes, I'affectation des differentes taches aux differentes 
files d'attente reste mchangee. L'association des premiere et de uxieme variantes precitees est particu lierement eff icace 
pour 1'amelioration des performances du systeme tant que de nouvelles taches se creent en permanence. Par contre 
lorsque eel etal cesse, par exemple en fin de travail du sysleme : on peut etre amene a constater de nouveau des 
des§quilibres de charge. 

[0027] Aussi, I'invention peut comprendre une troisieme variante de realisation, dans laquelle on reaff ecte des taches 
entre differentes files d'attente, de facon periodique par exemple. 

[0028] Cette disposition n'a generalement que peu d'effet en regime normal (creation continue de taches) sur les 
performances d'un systeme multiprocesseur symetrique, e'est-a-dire du type n SMP fl precite. Elle peut cependant seve- 
rer utile pour un systeme de type "NUMA 0 precite. 

[0029] Uinvention a done pour objet un procede d'affectation de taches dans un systeme de traitement de donnees 
numeriques multiprocesseur, a systeme d'exploitation preemptif, comprenant un nombre determine de processeurs 
susceptibles de traiter lesdites t§ches en paralleie, caracterise en ce qu'il comprend au moins une phase preliminaire 
pendant laquelle lesdits processeurs sont repartis en groupes, chaque groupe comprenant des nombres predetermines 
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!™f 1 U ,1 m6c ?™ mB dit ° de ve ™- est utilise dans un certain nombre de circonstances, pour eviter un acces 
concurrent a une tache. et notamment .orsqu'une tache est ajoutee ou retiree de .a fi.e d'attente 5. ou lor Sq S,.e change 

s m^LST! .T'l aiS6m8 ? ! qUB , C9 , mecanis ™ de verrou global soil generates de contentions lorsqu'il est f requem- 

^^i^ST 0 " SCalabi,i,6 • ^ inC ° nV6nient 6St amP ' ffi6 IOrS£,Ue 19 syst^ e mu.,iproce q s se :r 

[0041] Aussi, selon une caracteristique importante de ('invention, dans un premier mode de realisation on orevoit 

TJZZ " e d ' a " en,e UniqU6 ' " *» V8rr ° US qUi ' Ui SOnt assOCi6s ' « P' usi — ens e mbtl L° d . a P Ze 

10 D ^S™l i £ Ur i ! l 2 illUStre sch6mati q^ment un exemple d'architecture de ce type. Le systems 1 comprend comme 
prscedemment, plusreurs processeurs. Cependant, ces processeurs ont ete rassemb.es en groupes de processes 
par example tro,s groupes references G a a G Chaque groupe, G a a G„ peut comprendre un nombre i^que ou 

Z sYeuT 20 « 21" ,e oSIoe^ T d ' QXemPle - ° n 3 S "PP°- arbit -^— t que le groupe ^com ena' deu 
is SSS? S i 1! " 9 ° UPe .?* tr0 ' $ P rocesseur s. 20 6 a 22 6 , et le groupe G, un seul processeur, 20 c 

E?? 1 h ! UnS Pr6m,ere carac «6ristique importante de Invention, la file d'attente unique figure 1 5) 

est desormars drv.see en une plura.ite de files d'attente. De facon plus precise encore, le nombre de Z c attente as 
6gal au nombre de groupes de processeurs, soi, trois files d'attente dans I'exemp.e de la figure 2 : 5 a 5 chaque fife 
d attente slant associee a run des groupes de processeurs G a G 

*o EE. TCT^T^ 3Utre aSP6Ct imPOr,ant - Ch3qUe ^ * 3 T - " a « eCt6e » «- d '-tente particu- 
late jeux de pSr 1 aSS ° Cia,i ° nS ^ " * Sera " ^' d de ,a figure 4, a 
[0046] Le choix du nombre de groupes de processeurs, et done du nombre de files elsmsntaires, depend de nom- 
breux parametria dans un systeme mu.tiprocesseur de caracteristiques donnees. Genera.ement. oetteTpartmonTe 
peut pas etrs obtenue par des ca.culs preambles, mais par .'experimentation et la mesure 

[0047] Le but que ce fixe ('invention est d'augmenter les performances globales du systeme par le biais d'une meilleu- 
re repartrtron des taches entre processeurs individuels. Aussi, .es experimentations et tests pLtes Snsis^rom dans 

etT llafe " f, ^T™* * ^ " * *« seton ,a tarmTnl^ anglo 

SEES 1 f ! CU,6r Par ' e SyS,6me - La "^partition des processeurs en groupes associss a des fMes 
d attente s.smsnta.res donnant les meil.eurs rssuttats. d'un point de vue performances est retenuH ce stade La 

S^I^^Tm^^ " 9e ' 6e " 6t U,iliS6e P ° Ur l6S syst *™* de ™*n. structure fabriques parTa suite 
^3 J est da-lleurs a presumer que. a priori, les meilleures performances devraient etre atteintes en associant 
une file d'attente a chacun des processeurs. En d'autres termes, chaque groupe serait rtdrt^T^iSSJ? 
tecetlereparttape,. sngsndrer des difficulty de realisation. Aussi, un compromis est generalement pSe T 

^Sn,? ePend , ant ' C ° mme " 3 Ste indiqUG ' leS archit ^tures des systemes multiprocesseurs du type "NUMA" ac- 

rsacrs^r^r ce cadre et rappeier b — ,es ™ u - s 

[0051] Le systeme 1 est divise en modules, par exemple en deux modules, et M comme represente sur ia fioure 
3 (ce nombre pouvant etre quelconque). Chaque module, et M,, comprendun nombre que.conqueXro^sseuS 

f G rn^rm2°J lf H ° 3 21 , 3 > res P ec, 'vement. En effet, lorsque le nombre de processeurs en parallels augments 
les performances du systeme global augmentent tout d'abord sensiblement lineairement. puis la courbe s'inS Le 
nombre quatrs prsc.ts represente en general une va.eur optimale. Les processeurs de chaque module /ll e M som 
connec.es a des bus internes aux modules. B 0 et S, respectivement, et chaque modu.e comprend no^mmen't une 

ce a > em ° 5 v Les modu,es • M ° et et leurs m6moir « s associ6es - A et 

eS h SOUS : SySl r 8 ? tyPe ° SMP ° Pf6Cil6 - L6S modu,es ' M» et M,. son. re.ies entre euxpar un lien Let un 

^ Ca S ' Cl 61 ^- qUi constitue nt un prolongement des bus internes precites 
[0052] On concct aisement que, par exemple, la lecture ou I'ecriture d'une donnee de ou dans une memoire externe 

LZT* h " ?ar m Pr T SS6Ur de " m<X,U ' e> 86 ,raduise P ar une ^gradation des performances du systeme oar 
Si r r 6 ° n enti6remem ex6cu,6e ^ '^erieur d'un meme modu.e. Les performances sent egaTemen 

degradees lorsque les donnees doivent transiter d'un module a .'autre par le lien qui ne peut generalement pas fonc 
tionner a la meme Vitesse qu'un bus interne. yo'«er d iemeni pas ronc- 

5S fff! 31 H , A ? Si ' °^ 3 PrOPOS6 dSS proc6d6s Permettant d'obvier tout ou partie des prob.6mes sp^cifiques poses par 
% * dS ,yPS NUMA °' PfOC6des qui sortent du cadr e P^cis de .'invention P 
P rf ?w ' e , PrOCed6 dS '' invention ' dans P^mier mode de realisation, puisqu'il permet de limiter les 
contentions, du fart de la partition des fi.es d'attente et des verrous associes. trouve une application panicuSement 
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chacune des files d'attentes. respectivement 5 a et 5*: T r T 2 el T r T A pour la file d'attente 5 et T* a 7V et 7 nour 

l :^^^^s^T es - el,es - - - » — " ^ £i T SK 

d ^^ 

? "T 5 - P ° Ur " ,aire ' °" P9Ut r6S6rVer Une ,i,e d ' attente au * taches a P*** £e tutefois ce e 
d.sposrt.on n est pas toupurs env.sageable. C'est le cas par exemple lorsqu'un processus comprend des laches Hees 

N iZZT h° U ,aChe d0it a '° rS r ' Sider d3nS 13 ,i,e d ' attente ce P'ocessTur ou au 9 n^ ai£S 

il appartient. L'ordre des priontes est traite a I'interieur de cette file d'attente 

[0070] En resume de ce qui vient d'etre decrit, le precede selon ('invention, dans le premier mode de realisation nui 
consists a demu.t.p.ier les files d'attente, a affecter chaque file d'attente a un groupe de processeur^ et TaZTr 
cheque tache a une file d'attente permet bien d'ameliorer les performances g.oba les du systeme E effe es conten 
tions sont reduites, car les verrous sont dgalementdistribues. me. tn eneues conten 

K? 7 ! 1 . E ". ° U ! re ' 16 PrOC ^ P6rmet ' danS me arch «ecture de type 'NUMA" d'implanter un mecanisme dit de "Weak 
TZJT termin0, ° 9ie -9'°-xonne. Un .e. mecanisme favorise I'executton d'une tacheTu ProcesTeur 

T m T> n ^ n ' qU8, ^ qU ' PSrmet de Urer ° n P ' US 9fand b6n6ficie de la m *rnoire cacr >e d ite ^ "niveau 3- Tssoc^e 
au module. Or, pu.squ',1 est possible d'associer une file d'attente a des processeurs appartenant a un seul module le 
distnbuteur peut aissment confiner les laches dun processus dans un seul module ' 
[0072] Le precede selon le premier mode de realisation trouve cependant des limites lorsque le nombre de laches 
e de groupes de processeurs augmentent fortemenl. En effel, lors de la creation 'physique" d'une ihe ceTe dSoi! 
o i a!,i ^ ,iteS d ' att8nte dU SyS,6me ' Sn ,aiSant USa 9 e d<Un -^anisme'de distribut^n donn" Jusqua 

a ntrt! UPP H« e '^T""* ^ " diS,fibU,i ° n *** f6M sur "™ base d'squi-repanTon 

temporelle entre les drfferentes files d'attente, dans la mesure ou elles ne sont pas pleines Pour ce faire on oeut 
ut.hser un a Igorrthme b,en connu du type "round robin", e'est-a-dire a tour de r6.e Une telle methode n'e TpaT sane 

noZZT ,S ? COndi,i ° nS Pr6ci,6eS ' 168 laches P r6sentant des caracterietiques non homogenes 

notamment en ce qu, concerns le temps de traitement necessaire. il peut arriver qu'une ou plusieurs files d'attente 
scent ou pet, chargees, et done que les processeurs des groupes qui leur sont associes soient en sousiharae 

.nverse, une ou p.us.eurs autres fi.es d'attente peuvent presenter des surcharges importantes II apparatt done un 
Phenomena de desequ,hbre de charges, qui a d'au.an. plus de chance de se prolre que le nomb e de fi es d'attente 
T I ? T S 3 tra,t ! r S ° nt 6,SV6S - ^mentation escomptee des performances g.obales du systeme est 
^Zn^ Sr, 08 P^omene parasite. Dans certains cas particu.ierement defavorab.es. ^essuTd'un 
IZ \t 'h ! ? 9 ! !' • SeU " QUI depend des resso " rca s propres a un systeme particu.ier. il arrive de constater 
que les d.spos.t.ons du precede de .'invention sont contre-productives, en ce sens que les perfo^aTes du ^SSi 
son. moms bonnes que cel.es d'un systeme de .'art connu presentant .es memes ressources infornSques 
[0073] Auss.. selon un second mode de realisation, mode de realisation prefere. susceptible de plusieurs variantes 
on adopte des d,s P o SI t,ons supplementaires permettant un (re-)equilibrage de .a charge entre toSSSZEZlZ 
d auentes. ou pour le mens un traitement optimise des taches reparties dans .es files d'attente. de manie e 1 ce que 
les processeurs so.ent ut.l.ses de faoon optimisee. On doit bien comprendre cependant que. selon ce second mode 
Jn^ ! T I tOU ' eS Variant9S ' ,6S dis P° siti0 ^ P'°P'*s a " Premier mexfe sont conserveTs Notamme^n 

ectuJe Z *Z °m Z « n t 9f0UP ! S (qUi PeUV6nt COInCider 3VeC UnS repartiti ° n en modu,es dans un s^me d a chi 
ecture de type NUMA ) et on prevort plusieurs files d'attente. une par groupe de processeurs. 

S,o 0 , e l° Pera '°? necessaires P° ur obtenir cette configuration a files d'attente muttip.es, genera.ement effec- 
un ZZ1 Th P i° ? S ' h COnS,itUent donc une P»*SW° ''on pourra qua.ifier de pre.iminafe. En mode p JZn , 
un (re-)equ,l,brage des taches entre files d'attente ou de la charge de travail entre processeurs va etre obfenu selon 

oue T C ° nS,l,Uam pr6ciSement trais varta ntes du second mode de realisation. .. dott d s ZrsTre note 

que ces tro,s mecanismes peuvent coexister et ne sont pas exclusifs I'un de .'autre. Tout au contraire dans un mode 
de rea sat-on prefere. on cumulera ces trois mecanismes, pour le moins .es deux premiers qui donnent .L meiZrs 

so EST" Tf f UX ° bjeCti,S POUfSUiViS Paf '' inVention ' comma » sera precise cypres. 

[0075] Selon la prem.ere variants de realisation, un equilibrage des taches est obtenu en les rspanissant ds facon 
opt m entre ,es drfferentes fi.es d'attente lorsqu'e.les apparaissent "physiquement", et non plus simp.ementl tour 
fo^e? { T> , r °H P - eC,W) - La ,a? ° n Pr6dSe de Ch0isir une file d ' a,tente va ^e Precisse ci^prss ? 
Stion^f H X ' eme V3riante dS r6aNsation ' un 'sequilibrage «*" traitement des taches est obtenu en optimisant 

- ToXTa lTZ^Z PfOCBSSeU T ( L ° rSqU ' Un PrOCeSSSUr d6tecte <*» ,a file d ' attente *™ "t associee'esTvS 
e qu Una plus de tache en cours de fragment, il va chercher une tache a trailer dans une autre file d'attente dite 

v d^onT.a eh' ^ T ba ' aya9e ^ aUtfeS fi,6S d ' a,tentS d " S ^ S,6me ' ^ Ce ^ tro uve une fl dlttente non 
sSectLn^e *ZEZ T*"*™' 3 * U " SeUH d6t °™ Le Ch ° ix d ' une tache P^ise dans la file d'attente 
select,onnee, s effectue selon un processus qui va etre detaille ci-apres. De fa ? on pratique, e'est le "dispatcher" qui 
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aussi calculee a chaque fois qu'une instruction d'execution est initiee 

£3 L^ZT\ Char9e - FA \ BSt Variab ' e com P°sita comprenant des constantes (coaf charge CPU e, 

[0092] Ces dispositions presentent de nombreux avantages, notamment les su.vants : 

permettent de repondre tree rapidement a des medications ega.ement rapides du comportement du sys- 

ln^TT alk T d °l a f 3 ' 96 com P° sile est sir "P'«. «r basee sur deux valeurs qui peuven. etre recherchees 
dans une m§me ligne de la memoire cache de "niveau 2" recnerchees 

iissss^j^s; : " pourrait inc,ure d,autres vaHabies ' par exemp,e de * * 

d/ le desequilibre dans des modules materiels est automatiquement pris en charge (e'est-a-dire le nombra 

ESS— — rrsK==aa~~ 

Ts^teml ^Le^^nT aeMnM1 ^ m ^ u " de recherche possible d'une tache dans les files d'attentes 

qu'en" tLnTgue de besoT "* ^ ' 6S ^ S « " — ^ecl 

52 panX^ 4 - ,es p r esseurs 6me,,eni des requstes 

suppose rci que la file dattente 5^ du processeur 2 q est vide et que celui-ci devient 



35 



40 



45 



SO 



SS 



9 



BNSDOCID <£P. 



1043658A1 J_> 



10 



15 



20 



25 



30 



35 



40 



45 



50 



55 



EP 1 043 658 A1 

fe 0 squL les suivants° nCeme * ^ ™ * M ™" ** *™ enX priS en COm P te ' et *>*™ 

1/ I'affinite avec un processeur. c'est-a-dire !e fait que la derniere distribution de la tache s'est effectuee sur ce 
processeur ; 

2/ I'affinite avec un module, dans le cas d'une architecture de type "NUMA", c'est-a-dire le fait que la derniere 
distribution de la tache s'est effectuee sur ce module ; 
3/ la priorite affectee a une t§che ; 
4/ la localisation de la t§che ; 
5/ le fait que la tache ait deja ete "aidee" ; 
6/ le fait que le processus soit mono-t3che ; 
II la quantite de memoire accedee par la tSche ; 
8/ I'utilisation du processeur ; et 
9/ la duree de vie de la tSche. 

[0111] En ce qui concerne le facteur 3/ (priorite), il est preferable de "sauter" les tache de plus haute priorite c'est- 
Mr. les premieres taches dans la file d'attente "aidee". En effet, la probability est grande qu'elles soient prises en 
charge par un processeur local, du fait precisement de la haute priorite qui ieur est associee, avant qu'elle puisse etre 
tra. ee par le processeur eloigne. L'utilisation d'un seuil predetermine semble etre une solution appropriee pour cette 
part.edu processus En outre, les taches de plus faibles priorite sont generalement, en moyenne stalistique, des laches 
qui utilisent le plus le processeur. 

[0112] La determination d'une valeur de seuil est importante. En effet, si la valeur de seuil est trop basse c'est-a- 
dire que le nombre de taches sautees est trop faible. le mecanisme d'aide se trouve alors souvent en confli't avec le 
mecamsme standard de distribution des taches. c'est-a-dire le mecanisme commun a tart connu. En sens contraire 

p!efement^lfficace Une Va ' 6Ur ^ aUCUn ° ^ "° P ° Urra ^ lf ° UVde St ' 9 m6canisme d 'aide s'avere com- 

[0113] De facori , pref erentielle, pour Stre aussi independant que faire ce peut de la charge de travail on met en 
oeuvre un precede auto-adaptatif, par exemple le suivant ■ 

ItaJSh ^ n ° m f rede * aches sautees est * une valeur comprise entre le nombre de processeurs et le nombre 
de taches executable dans .'ensemble de file d'attente. Cette valeur est increments d'une unite chaque fois que a 
tache cho.s.e pour etre 'aidee' est. soit deja verrouillee, soit n'est pas a I'etat executable. Cette valeur est decrements 

t SIS?,! T qUS H f ° ,S H qU t ai : CUne ttche n ' est trouvee ' ,orsc > ua to maximum de taches a ba.ayer est superieuT 

a la mome du nombre de taches executables. 

[0115] Le nombre maximum de taches a balayer est fixe a une valeur comprise entre I'unite et le nombre de taches 
executables dans .'ensemble de file d'attente. Cette valeur est increments d'une unite chaque fois qu'aucunelache 
n est trouveeou chaque Urn que la tache choisie se trouve dans le dernier quart des taches balayaes (taches de plus 
basses pnontes). Cette valeur est decrement** d'une unite chaque fois que la tache choisie se trouve dans le premier 
quart des taches balayees (taches de plus hautes priorites) premier 

A L Hd! aCteUr 4/ < localisati ° n > est - a Priori, un facteur tres important. Cependant, ce facteur est generalement 
segment de mimofre ^ envir ° nnement de *P* " UNIX "- la localisation de la tache so? connue par 

l<n \ 7 }- , E 1 C H qU J conceme le ,ac,eur s/ - °" P e "t generalement admettre que, si une tache a deja ete "aidee" elle 
peut deja res.der dans plusieurs modules. II s'ensuit que de la deplacerailleursneconstitue pas une operation couteuse 
en terme de degradation de performances. 8 

L?l 18] , E n 06 qui ,f ncerne 16 ,acteur 71 - « s, a9rt egalement d'un facteur important, mais qui ne peut etre determine 
a.sement. Deux criteres permettent d'arriver a une approximation raisonnable: e oeierm.ne 

a/ la taille memoire utilised par le processus ; et 

b/ -I'interactivite" de la tache. ce critere etant'defini par le fait qu'une tache soft souvent "dormante" ou non. 

[0119] Le critere b/ peut etre obtenu a partir d'un comptage du nombre de fois ou elle est a I'etat "dormant" ce qui 
peut se driver de statistiques generalement disponibles. 

Kl™ , E ^ C t qUi H C T C ! i m !, er,fin ^ ,aCtSUr 9A " SSt ais6 de comprendre qu'il n'est pas utile de tenter de prendre en 
charge tes .Sches de faible duree de vie. En effet, la plupart d'entre elles disparaissent a court terme 

EL 111 E t" tGnan l C ° mP,e 1m ° U PartiS dS 068 diff6rents f ecteurs. il est possible de determiner quelle tache doit 
etre s6 ectionnee dans une Me d'attente, en definissant un cout individue. associe a chaque facteur et d'en deduire 
un cout global assoc,6 a une tache particuliere. On peut. pour ce faire construire une table a deux entrees : facteurs 
- couts. La tache presentant le cout global le plus faible est selectionnee, e'est^-dire celle causant la degradation 
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- si $CLP-Adl\ < ll^Sfl trouver la file d'attente d'indice arbitraire y pour laquelle le parametre \\CLP - a5\\ est 
minimal ; " 

- migrer ce processus vers I'ensemble de file d'attente le moins charge 5 y et 

" ^£« re 6 j°" r le tecteurrepresentatif du desequilibre des deux ensembles de file d'attente, soft a5 - W - 
* Cl -P x et AD y = AD y - CLPy. * * 

[0134] Le vecteur de charge composite est un vecteur a trois dimensions. En effet. il depend des parametres 

io - charge du processeur ; 

charge de la memoire ; et 
priorite. 



[0135] Les deux prem.ers parametres dependent a leur tour de la configuration materielle et logicielle precise du 
systeme cons.dere : nombre de processeurs, taille de la memo.re, nombre de pages memoire fibres, etc La determi- 
nation^ ces parametres est commune a I'art connu et obtenue par des calculs classiques, biens connus de I'homme 
fniT 6 T,! parame,re 'P rior,te " est obtenu a Pa^tir de la moyenne des priorites attachees aux differentes taches 
[0136] Theoriquement. la determination de la charge d'un ensemble de file d'attente est donnee par la somme des 
charges de processus. Mais pour accelerer cette determination, on la derive directement a partir de statistiques ge- 
neralemen. stockees dans la structure de donnees de cet ensemble. La charge depend de nouveau de trois 
parametres : charge du processeur, charge de la memoire et priorite. - 
[01 37] La determination de la charge composite moyenne peut etre obtenue a partir de la relation suivante : 

Z^< 

ACL = ^ ( 3) 

P 

30 relation dans laquelle est la charge composite du *™ ensemb , e de fjle d . attente et p |e nombfe , ota| d . ensemb|es de 
Tile aattente. 

[0138] Le desequilibre moyen peut etre determine a partir de la relation suivante : 
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EL La t d H 8 . te ^ inat,on du c ° ut associe * ""e operation de migration peut etre obtenue en considerant que le cout 
principal est du a la migration de pages de memoires, dans un environnement de type "UNIX" (ou a I'acces a des 

elo ' 9nees) et au coflt lie au deplacement d'une tache d'un ensemble de file d'attente a un autre 
[0140] Une approximation de ('estimation du cout est obtenue directement par le nombre de pages associees au 

off d8 tSCh8S d9Vant etre ^P**** Dans un environnement autre que I'environnement 

UNIX , I'entite "page de memoire" doit etre remplace par une entile equivalente 

1l n. C f m °f eS de d6termination des Parametres impliques ne sont precises qu'a titre d'exemple, pour fixer les 
idees. D'autres alternatives existent et soma la portee de I'homme de metier .purrixeries 

[0142] S, on se repone de nouveau a la figure 8, la courbe C c illustre schematiquement I'allure de I'amelioration des 
performances par rapport a .'art connu (courbe Q. Cependant, .-experience mon.re que, dans le cas gen6 a Tame 
lioration obtenue par rapport a celle obtenue par la deuxieme variante est peu importante. Ceci est du essentieilement 
au fait que le deplacement physique des taches entre files d'attente implique un cout non negligeable ce rneme si 
celu.-c.nes pas generalise, conformement aux dispositions preferentielles qui viennent d'etre rappelees mais au 
contra.re select.f . On reservera cette variante du precede selon ('invention a une architecture de type "NUMA" car 
dans le cas d une architecture classique de type "SMP», I'amelioration des performances n'est pas significative alors 

55 83 ^' Se , en ? UVrS n ,t Ce8Site dSS modifications du systeme d'exploitation et la presence d'organes supplemental- 

55 res, materiel ou log.que (figure 7 : 8). 

E!S n i 3 le ? tUre dS CS qUi P r6c&de ' 00 constate aisement que ('invention atteint bien les buts qu'elle s'est fixes 
[0144] n doit etre cla.r cependant que ('invention n'est pas limitee aux seuls exemples de realisations explicitement 
decnts. notamment en relation avec les figures 2 et 4 a 8. K 
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de charge composite est calcule comme etant la somme de la charge d'un processeur ou d'un groupe de eroces- 
seurs associe a ladite file d'attente elementaire et la charge des moyens de memoire associes a ce processeur 
ou ce groupe de processeurs. H J 

Precede selon la revendication 6, caracterise en ce qu'il comprend une etape prealable consistant a tester si ladite 
nouvele tache (Tz) est l,ee a une desdites files d'attente elementaires (5, 5, 5y , 5 p ) et en ce que lorsque ledit 
test est positrf a aiguiller ladite nouvelle tache vers cette file d'attente elementaire. 

9. Precede selon Tune quelconque des revendications 1 a 5, caracterise en ce qu'il comprend au moins une phase 
supplemental consistant, lorsque I'une desdites files d'attente elementaires (5.) associee a I'un desdits groupes 
de processeurs (2 q ) est vide de taches executables, a rechercher une file d'attente elementaire (5 ) dite eloiqnee 
non vide et dans cette file d'attente elementaire (5 y ) a selectionner une tache executable par I'un desdits proces- 
seurs (2„) dudit groupe de processeurs associe a la file d'attente elementaire vide (5,) et a la transmettre a ce 
processeur (2 q ) pour y etre traitee, de maniere a equilibre globalement le traitement desdites taches dans ledit 

7i systeme (1). 

10. Precede selon la revendication 9. caracterise en ce que ladite file d'attente elementaire non vide (5 ) doit presenter 
un seuil d'occupation minimal predetermine. y Phonier 



20 11. 



25 



30 



35 



40 



45 



SO 



55 



Precede selon la revendication 10, caracterise en ce qu'en outre, les laches etant enregistrees par ordre de priorite 
decroissante. un nombre predetermine de taches est saute avant de balayer les autres taches de ladite file d'attente 
elementaire non vide (5 y ) pour rechercher une tache executable et la faire trailer par I'un desdits processeurs (2 ) 
dudit groupe de processeurs associe a la file d'attente elementaire vide (5,,). " 

12. Precede selon la revendication 11 , caracterise en ce que ledit nombre de taches sautees et le nombre maximum 
de taches balayees parmi toutes celles enregistrees dans ladite file d'attente elementaire non vide (5 ) sont va- 
nables dans le temps et sont determines par un processus auto-adaptatif a partir du nombre de taches trouvees 
ou non pendant lesdits balayages et de la place de ces taches class6es par ordre de priority dans ladite file 
elementaire non vide (5^). 

13. Procede selon I'une quelconque des revendications 9 a 12. caracterise en ce que ladite tache selectionnee est 
celle associee a une valeur minimale d'un parametre dit de cout. mesurant la degradation de performances globale 
dud,t systeme (1), due au traitement de ladite tache selectionnee dans ladite file d'attente elementaire eloiqnee 
non vide (5„) par I'un desdits processeurs dudil groupe de processeurs associe a la file d'attente elementaire vide 

14. Procede selon I'une quelconque des revendications 1 a 5, caracterise en ce qu'il comprend au moins une phase 
supplementary comprenant au moins une etape de mesure periodique d'une repartition equilibria desdites taches 
dans lesdites files d'attente elementaires (5^ 5^ 5^ 5 p ) et, lors de la determination d'un etat desequilibre dudit 
systeme (1), une etape de deplacement selectif de tSches d'au moins une file d'attente elementaire plus charqee 
(5 X ) vers une file d'attente eldmenlaire moins chargSe (5 y ). 

Procede selon la revendication 14, caracterise en ce que, lorsque ledit desequilibre est inferieur a un seuil deter- 
mine, aucun deplacement de tache n'est realist. 
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Procede selon les revendications 14 ou 15, caracterise en ce que tout ou partie desdites taches appanenant a 
des processus multitaches, chaque processus multitache n6cessitant une taille de memoire et une charge de 
trava.1 delerm.nees, il comprend une etape de mesure desdites charges de travail et desdites tallies de memoire 
en ce qu'.l comprend la selection du processus necessitant la plus forte charge de travail et la plus faible taille de 
memoire, et en ce que ce que toutes les taches dudit processus selectionne sont dSplacees vers la file d'attente 
elementaire la moins chargee (5 y ). 

17. Procdde selon la revendication 1 6. caracterise en ce qu'il comprend une 6tape preliminaire consistant a tester si 
toutes les taches dudit processus multitache devant etre d<Splacees appartiennent a ('ensemble de file d'attente 
elementaire le plus charge (5 X ) et si aucune tSche n'est Ii6e k I'un desdits groupes. 

1 8. Procede selon I'une quelconque des revendications 1 a 1 7. caracterise en ce que ledil systeme d'exploitation est 
du type UNIX (marque d6posee). 
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